Enquêtes et échantillonage
2025-06-01
Il existe de très nombreuses méthodes de constitution d’un échantillon représentatif d’une population. Les principales sont :
La solution idéale est de disposer d’une liste complète des individus membres de la population que l’on veut étudier et que l’on appelle base de sondage.
La population ivoirienne de plus de 18 ans est connue à travers le recensement général de population de 2021.
Les étudiants de l’Université d’Abidjan sont connus grâce au fichier des inscriptions.
Les étrangers en situation irrégulière ne sont pas connus et ne disposent donc pas de base de sondage.
La solution la plus évidente et la plus fiable d’un point de vue statistique est de tirer au hasard les individus dans la liste complète pour obtenir un échantillon de la taille souhaitée.
echantillon aléatoire
Source : http://www.mathwebs.com
Pour mieux observer certains phénomènes, on divise la liste en groupes (= strates) et on tire au sort les individus dans chacun de ces groupes.
echantillon aléatoire stratifié
Source : http://www.mathwebs.com
N.B. Les échantillons stratifiés ne sont donc pas forcément représentatifs de l’ensemble de la population. Il sont en revanche représentatifs de chacune des strates.
Le sondage en grappe consiste à tirer au sort non pas directement un individu, mais des unités collectives. Ce type de sondage est utilisé lorsqu’on n’a pas de liste des individus, mais qu’on dispose d’une liste de grappes réunissant plusieurs individus.
source : http://www.mathwebs.com
L’ensemble des individus de l’unité collective sont inclus dans l’enquête.
tirage aléatoire par grappes
Source : http://www.mathwebs.com
On ne dispose pas de base de sondage (liste d’individu) mais on connaît les caractéristiques d’ensemble de la population (e.g. âge, sexe, diplôme, …).
Du coup, on va choisir des indvidus de telle sorte que la composition de l’échantillon corresponde à celle de la population de référence.
Les enquêteurs doivent choisir des personnes de façon à remplir simultanément plusieurs objectifs.
C’est facile au début … mais il est souvent difficile d’arriver pile sur le quota demandé.
Exemple de fiche d’objectif :
méthode des quotas
Exemple de quotas pour la population adulte française
méthode des quotas
Source : définitions-marketing.com
méthode “pratique”
Méthode “boule de neige”
On a demandé à 30 étudiants de licence 3 de collecter les réponses à un petit questionnaire mis au point sur Kobo Toolbox.
Le questionnaire ne comportait que 10 questions et pouvait être administré en 5 minutes environ.
Chaque étudiant devait obtenir 10 réponses, 5 de personnes de nationalité française et 5 de personnes d’une autre nationalité.
Questionnaire UPC
Représentatif au niveau mondial ?
Questionnaire UPC
Représentatif au niveau de l’Ile de France ?
Questionnaire UPC
Représenatif de l’Université Paris Cité ?
Afrobaromètre utilise des échantillons probabilistes nationaux conçus pour générer un échantillon représentatif de tous les citoyens en âge de voter dans un pays donné. L’objectif est de donner à chaque citoyen adulte une chance égale et connue d’être sélectionné pour une interview. Nous y parvenons en en utilisant des méthodes de sélection aléatoire à tous les stades de l’échantillonnage et à tous les stades avec une probabilité proportionnelle à la taille de la population dans la mesure du possible afin de garantir que les unités géographiques plus grandes (c’est-à-dire plus peuplées) ont une probabilité proportionnellement plus grande d’être sélectionnées dans l’échantillon.
L’univers d’échantillonnage comprend normalement tous les citoyens âgés de 18 ans et plus. En règle générale, nous excluons les personnes vivant dans des institutions, telles que les étudiants dans les dortoirs, les patients dans les hôpitaux et les personnes dans les prisons ou les maisons de retraite. Occasionnellement, nous devons également exclure les personnes vivant dans des zones jugées inaccessibles en raison d’un conflit ou de l’insécurité. Toute exclusion de ce type est mentionnée dans le rapport d’information technique (RIT) qui accompagne chaque ensemble de données.
Source : https://www.afrobarometer.org/surveys-and-methods/sampling/
Les échantillons comprennent généralement 1200 ou 2400 cas. Un échantillon de n=1200 cas sélectionnés au hasard permet de faire des inférences sur les populations adultes nationales avec une marge d’erreur d’échantillonnage ne dépassant pas +/-2,8 points de pourcentage avec un niveau de confiance de 95 %. Avec un échantillon de n=2400, la marge d’erreur diminue à +/-2,0 points de pourcentage avec un niveau de confiance de 95 %.
Le plan d’échantillonnage est un échantillon probabiliste en grappes, stratifié, à plusieurs degrés et par zone. Plus précisément, nous stratifions d’abord l’échantillon en fonction de la principale unité de gouvernement infranationale (État, province, région, etc.) et de la localisation urbaine ou rurale.
La stratification par zone réduit la probabilité que des groupes ethniques ou linguistiques distincts soient exclus de l’échantillon. Afrobaromètre sur-échantillonne parfois volontairement certaines populations politiquement importantes dans un pays afin de s’assurer que le sous-échantillon est suffisamment grand pour être analysé. Tout suréchantillon est noté dans le TIR.
Source : https://www.afrobarometer.org/surveys-and-methods/sampling/
Les échantillons sont constitués en quatre ou cinq étapes :
Pour maintenir les coûts et la logistique du travail sur le terrain dans des limites gérables, huit entretiens sont regroupés dans chaque UPE sélectionnée.
Source : https://www.afrobarometer.org/surveys-and-methods/sampling/
Pour certaines enquêtes nationales, les données sont pondérées pour corriger le sur-échantillonnage, le sous-échantillonnage ou la taille du ménage. L’option « Withinwt » doit être activée pour toutes les statistiques descriptives au niveau national dans les pays qui contiennent cette variable de pondération. Elle est incluse dans l’ensemble de données et les détails sont décrits dans le livre de codes. Pour les ensembles de données fusionnés, « Combinwt » doit être activé pour les comparaisons transnationales des statistiques descriptives. Note : Cette variable de pondération standardise tous les échantillons nationaux comme s’ils étaient de taille égale.
Dans les cycles 1 à 3, Afrobaromètre n’a procédé qu’à une pondération minimale des données pour corriger les sur- ou sous-échantillons de certaines populations, généralement en fonction de la région ou de la localisation urbaine ou rurale. Cependant, à partir du cycle 4, nous avons commencé à collecter des données supplémentaires (population de chaque zone d’énumération sélectionnée et population totale de chaque strate) afin d’améliorer nos calculs de facteurs de pondération basés sur les probabilités de sélection individuelles, qui sont maintenant incluses pour tous les pays. Cela nous permet de calculer des poids à l’intérieur des pays beaucoup plus complets et précis, qui peuvent être identifiés par la variable « WITHINWT »
Source : https://www.afrobarometer.org/surveys-and-methods/sampling/